Un modèle de langue pour l'estimation de la fraîcheur et la pertinence des documents Web

نویسندگان

  • Mariem Bambia
  • Mohand Boughanem
  • Rim Faiz
چکیده

An effective information retrieval system must satisfy different users search intentions expecting a variety of query categories, comprising recency sensitive queries where fresh content is the major user’s requirement. However, using temporal features of documents to measure their freshness remains a hard task since these features may not be accurately represented in recent documents. In this paper, we propose a language model which estimates the topical relevance and freshness of documents with respect to real-time sensitive queries. In order to improve freshness ranking, our approach models freshness by exploiting terms extracted from recently posted tweets topically relevant to each real-time sensible queries. Our experiments show that there is a clear advantage of using twitter to extract fresh keywords. MOTS-CLÉS : Requêtes sensibles au temps, Modèles de langue, Mots-clés frais.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Prise en compte de l'importance d'un site web dans l'estimation de la probabilité a priori de pertinence d'une page web

RÉSUMÉ. Plusieurs caractéristiques ont été utilisées pour estimer la probabilité a priori d’un document comme : la longueur du document, la structure des liens, le facteur temps. Cependant, ces caractéristiques dépendent seulement du document lui même. Or, dans le contexte du web une page web fait partie en général d’un site web. L’idée que nous explorons dans cette article est l’utilisation de...

متن کامل

Extraction de la localisation des termes pour le classement des documents

Résumé. Trouver et classer les documents pertinents par rapport à une requête est fondamental dans le domaine de la recherche d’information. Notre étude repose sur la localisation des termes dans les documents. Nous posons l’hypothèse que plus les occurrences des termes d’une requête se retrouvent proches dans un document alors plus ce dernier doit être positionné en tête de la liste de réponse...

متن کامل

فایل کامل مجلّه مطالعات زبان فرانسه دو فصلنامه علمی پژوهشی زبان فرانسه دانشکده زبانهای خارجی دانشگاه اصفهان

Tâ ÇÉÅ wx W|xâ Revue des Études de la Langue Française Revue semestrielle de la Faculté des Langues Étrangères de l'Université d'Ispahan Cinquième année, N° 8 Printemps-Eté 2013, ISSN 2008- 6571 ISSN électronique 2322-469X Cette revue est indexée dans: Ulrichsweb: global serials directory http://ulrichsweb.serialssolutions.com Doaj: Directory of Open Access Journals http://www.doaj.org ...

متن کامل

Exploitation des signaux sociaux pour estimer la pertinence a priori d'une ressource

RÉSUMÉ 'DQV FHW DUWLFOH QRXV SURSRVRQV XQH DSSURFKH GH UHFKHUFKH G¶LQIRUPDWLRQ 5, TXL prend en compte le contenu social associé à une ressource pour mesurer sa pertinence a priori vis-à-YLV G¶XQH UHTXrWH Nous démontrons comment ces caractéristiques, qui sont sous IRUPH G¶DFWLRQV UHOHYDQW G¶DFWLYLWpV VRFLDOHV VLJQDX[ VRFLDX[ WHOV TXH OH QRPEUH GH M¶DLPH et de "partage", peuvent être combinées po...

متن کامل

Modèle unifié pour la recherche d'information sémantique

Résumé : Un modèle documentaire permet de définir les unités d’indexation (mots, termes, etc.) et de les relier aux documents dans lesquels elles apparaissent. Il permet également de définir les liens entre documents ou portions de documents (ex. citation). Les modèles documentaires sont généralement exploités en recherche d’information pour la représentation des documents et des requêtes et il...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2015